智能论文笔记

elhmc: An R Package for Hamiltonian Monte Carlo Sampling in Bayesian Empirical Likelihood

Dang Trung Kien , Neo Han Wei , Sanjay Chaudhuri

分类： (统计)机器学习

2022-09-02

在本文中，我们描述了使用汉密尔顿蒙特卡洛方法从基于经验可能性的后验进行采样的{\ tt r}软件包。基于经验可能性的方法论已在最近的许多感兴趣问题的贝叶斯建模中使用。该半摩擦过程可以轻松地将非参数分布估计器的灵活性与参数模型的可解释性结合在一起。该模型是通过估计基于方程的约束来指定的。从贝叶斯的经验可能性（贝耶斯）后部提取推断是具有挑战性的。可能性是数值计算的，因此不存在后部的闭合表达。此外，对于任何有限尺寸的样本，可能性的支持是非凸，这阻碍了许多马尔可夫链蒙特卡洛（MCMC）程序的快速混合。最近已经表明，使用对数经验可能性梯度的性质，可以设计有效的汉密尔顿蒙特卡洛（HMC）算法来从贝内斯尔后部采样。该软件包要求用户仅指定估计方程，先验及其各自的梯度。从参数后部绘制的MCMC样本，并获得了用户所需的各种细节。

translated by 谷歌翻译

A Multi-scale Graph Signature for Persistence Diagrams based on Return Probabilities of Random Walks

Chau Pham , Trung Dang , Peter Chin

分类：机器学习

2022-09-28

持久图（PDS）通常以同源性类别的死亡和出生为特征，以提供图形结构的拓扑表示，通常在机器学习任务中有用。先前的作品依靠单个图形签名来构建PD。在本文中，我们探讨了多尺度图标志家族的使用，以增强拓扑特征的鲁棒性。我们提出了一个深度学习体系结构来处理该集合的输入。基准图分类数据集上的实验表明，与使用图神经网络的最新方法相比，我们所提出的架构优于其他基于同源的方法，并实现其他基于同源的方法，并实现竞争性能。此外，我们的方法可以轻松地应用于大尺寸的输入图，因为它不会遭受有限的可伸缩性，这对于图内核方法可能是一个问题。

translated by 谷歌翻译

Momentum Adversarial Distillation: Handling Large Distribution Shifts in Data-Free Knowledge Distillation

Kien Do , Hung Le , Dung Nguyen , Dang Nguyen , Haripriya Harikumar , Truyen Tran , Santu Rana , Svetha Venkatesh

分类：计算机视觉 | 人工智能

2022-09-21

无数据知识蒸馏（DFKD）最近引起了人们的关注，这要归功于其在不使用培训数据的情况下将知识从教师网络转移到学生网络的吸引力。主要思想是使用发电机合成数据以培训学生。随着发电机的更新，合成数据的分布将发生变化。如果发电机和学生接受对手的训练，使学生忘记了先前一步获得的知识，则这种分配转换可能会很大。为了减轻这个问题，我们提出了一种简单而有效的方法，称为动量对抗蒸馏（MAD），该方法维持了发电机的指数移动平均值（EMA）副本，并使用发电机和EMA生成器的合成样品来培训学生。由于EMA发电机可以被视为发电机旧版本的合奏，并且与发电机相比，更新的更改通常会发生较小的变化，因此对其合成样本进行培训可以帮助学生回顾过去的知识，并防止学生适应太快的速度发电机的新更新。我们在六个基准数据集上进行的实验，包括ImageNet和Place365，表明MAD的性能优于竞争方法来处理大型分配转移问题。我们的方法还与现有的DFKD方法相比，甚至在某些情况下达到了最新的方法。

translated by 谷歌翻译

A Novel Approach for Pill-Prescription Matching with GNN Assistance and Contrastive Learning

Trung Thanh Nguyen , Hoang Dang Nguyen , Thanh Hung Nguyen , Huy Hieu Pham , Ichiro Ide , Phi Le Nguyen

分类：计算机视觉

2022-09-02

药物误解是可能导致对患者造成不可预测后果的风险之一。为了减轻这种风险，我们开发了一个自动系统，该系统可以正确识别移动图像中的药丸的处方。具体来说，我们定义了所谓的药丸匹配任务，该任务试图匹配处方药中药丸所拍摄的药丸的图像。然后，我们提出了PIMA，这是一种使用图神经网络（GNN）和对比度学习来解决目标问题的新方法。特别是，GNN用于学习处方中文本框之间的空间相关性，从而突出显示带有药丸名称的文本框。此外，采用对比度学习来促进药丸名称的文本表示与药丸图像的视觉表示之间的跨模式相似性的建模。我们进行了广泛的实验，并证明PIMA在我们构建的药丸和处方图像的现实数据集上优于基线模型。具体而言，与其他基线相比，PIMA的准确性从19.09％提高到46.95％。我们认为，我们的工作可以为建立新的临床应用并改善药物安全和患者护理提供新的机会。

translated by 谷歌翻译

Black-box Few-shot Knowledge Distillation

Dang Nguyen , Sunil Gupta , Kien Do , Svetha Venkatesh

分类：计算机视觉 | 人工智能 | 机器学习

2022-07-25

知识蒸馏（KD）是一种有效的方法，可以将知识从大型“教师”网络转移到较小的“学生”网络。传统的KD方法需要大量标记的培训样本和白盒老师（可以访问参数）才能培训好学生。但是，这些资源并不总是在现实世界应用中获得。蒸馏过程通常发生在我们无法访问大量数据的外部政党方面，并且由于安全性和隐私问题，教师没有披露其参数。为了克服这些挑战，我们提出了一种黑盒子少的KD方法，以培训学生很少的未标记培训样本和一个黑盒老师。我们的主要思想是通过使用混合和有条件的变异自动编码器生成一组不同的分布合成图像来扩展训练集。这些合成图像及其从老师获得的标签用于培训学生。我们进行了广泛的实验，以表明我们的方法在图像分类任务上明显优于最近的SOTA/零射击KD方法。代码和型号可在以下网址找到：https：//github.com/nphdang/fs-bbt

translated by 谷歌翻译

A Study on Self-Supervised Object Detection Pretraining

Trung Dang , Simon Kornblith , Huy Thong Nguyen , Peter Chin , Maryam Khademi

分类：计算机视觉

2022-07-09

在这项工作中，我们研究了对象检测模型的自我监督预审计的不同方法。我们首先设计一个通用框架，通过随机采样和投射框来学习从图像中学习空间一致的密集表示，并将其投影到每个增强视图，并最大程度地提高相应的盒子功能之间的相似性。我们研究文献中的现有设计选择，例如盒子生成，功能提取策略，并使用其在实例级图像表示学习技术上获得成功启发的多种视图。我们的结果表明，该方法对超参数的不同选择是可靠的，并且使用多个视图不如实例级图像表示学习所显示的那样有效。我们还设计了两个辅助任务，以通过（1）通过使用对比度损失从采样设置中预测盒子中的一个视图中的框来预测框，并且（2）使用变压器预测盒子坐标，这可能会受益。下游对象检测任务。我们发现，在标记数据上预审计的模型时，这些任务不会导致更好的对象检测性能。

translated by 谷歌翻译

Towards Effective and Robust Neural Trojan Defenses via Input Filtering

Kien Do , Haripriya Harikumar , Hung Le , Dung Nguyen , Truyen Tran , Santu Rana , Dang Nguyen , Willy Susilo , Svetha Venkatesh

分类：人工智能 | 计算机视觉 | 机器学习

2022-02-24

特洛伊木马对深度神经网络的攻击既危险又秘密。在过去的几年中，特洛伊木马的攻击从仅使用单个输入 - 不知不线的触发器和仅针对一个类别使用多个输入特异性触发器和定位多个类的类别。但是，特洛伊木马的防御尚未赶上这一发展。大多数防御方法仍然使对特洛伊木马触发器和目标类别的假设不足，因此，现代特洛伊木马的攻击很容易被规避。为了解决这个问题，我们提出了两种新颖的“过滤”防御措施，称为变分输入过滤（VIF）和对抗输入过滤（AIF），它们分别利用有损数据压缩和对抗性学习，以有效地纯化潜在的Trojan触发器，而无需在运行时间内触发潜在的Trojan触发器。对触发器/目标类的数量或触发器的输入依赖性属性做出假设。此外，我们还引入了一种称为“过滤 - 对抗性”（FTC）的新防御机制，该机制有助于避免通过“过滤”引起的清洁数据的分类准确性下降，并将其与VIF/AIF结合起来，从种类。广泛的实验结果和消融研究表明，我们提议的防御能力在减轻五次高级特洛伊木马攻击方面显着优于众所周知的基线防御能力，包括最近的两次最新一次，同时对少量训练数据和大型触发器非常强大。

translated by 谷歌翻译

Training Robust Zero-Shot Voice Conversion Models with Self-supervised Features

Trung Dang , Dung Tran , Peter Chin , Kazuhito Koishida

分类：机器学习

2021-12-08

无监督的零射声语音转换（VC）旨在修改话语的扬声器特性，以匹配看不见的目标扬声器，而无需依赖并行培训数据。最近，已经显示了语音表示的自我监督学习在不使用转录物的情况下产生有用的语言单元，这可以直接传递给VC模型。在本文中，我们展示了通过使用长度重采样解码器来实现高质量的音频样本，这使得VC模型能够与不同的语言特征提取器和声码器一起工作，而无需它们以相同的序列长度运行。我们表明，我们的方法可以胜过VCTK数据集的许多基线。在不修改架构的情况下，我们进一步展示了a）使用来自同一扬声器的不同音频段，b）添加循环一致性损失，并且c）添加扬声器分类损失可以有助于学习更好的扬声器嵌入。我们的模型使用这些技术训练了Libritts，实现了最佳性能，产生了音频样本对目标扬声器的声音，同时保留了在字符错误率方面与实际人类话语相当的语言内容。

translated by 谷歌翻译

Revealing and Protecting Labels in Distributed Training

Trung Dang , Om Thakkar , Swaroop Ramaswamy , Rajiv Mathews , Peter Chin , Françoise Beaufays

分类：机器学习 | 自然语言处理

2021-10-31

诸如联合学习之类的分布式学习范例通常涉及通过网络传输模型更新或梯度，从而避免传输私有数据。但是，有关培训数据的敏感信息可以从这种梯度透露。先前的作品已经证明，可以通过某些模型的最后一层（例如，reset）分析标签，或者通过使用匹配[zhu等人]的渐变与当前状态的额外知识，可以与模型输入共同重建。模型。在这项工作中，我们提出了一种方法来发现从最后一层的梯度和标签映射的梯度发现一组训练样本标签。我们的方法适用于多个域的各种模型架构。我们展示了我们在两个领域的模型训练中的效果 - 图像分类和自动语音识别。此外，我们表明，当与我们的方法结合使用时，现有的重建技术可以提高它们的功效。相反，我们证明梯度量化和稀疏可以显着降低攻击的成功。

translated by 谷歌翻译

Neural Collapse in Deep Linear Network: From Balanced to Imbalanced Data

Hien Dang , Tan Nguyen , Tho Tran , Hung Tran , Nhat Ho

分类：机器学习 | (统计)机器学习

2023-01-01

Modern deep neural networks have achieved superhuman performance in tasks from image classification to game play. Surprisingly, these various complex systems with massive amounts of parameters exhibit the same remarkable structural properties in their last-layer features and classifiers across canonical datasets. This phenomenon is known as "Neural Collapse," and it was discovered empirically by Papyan et al. \cite{Papyan20}. Recent papers have theoretically shown the global solutions to the training network problem under a simplified "unconstrained feature model" exhibiting this phenomenon. We take a step further and prove the Neural Collapse occurrence for deep linear network for the popular mean squared error (MSE) and cross entropy (CE) loss. Furthermore, we extend our research to imbalanced data for MSE loss and present the first geometric analysis for Neural Collapse under this setting.

translated by 谷歌翻译